不可错过的单细胞转录组研究新维度:空间转录组
把病理切片裂解制备成单细胞悬液,得到了“是什么”,却丢失了“在哪里”。如何兼得类型和位置信息呢?follow me 跟小编一起解开空间转录组技术的面纱吧。
在生命科学研究的道路上,历经了多组学联合覆盖“面“的,单细胞技术涉及“点“的研究历程,为了更加深入的对生命机制,疾病机理等研究,科学家不断发明新的技术,丰富新的维度,空间转录组技术也由此得到了很大的提升,操作上由繁至简,技术上由少至多。今天跟大家分享的便是10X Genomics Visium 系统。
初识
10X Genomics Visium
该系统可以划分为5个部分,样本制备,显微镜成像,文库构建,上机测序和数据分析。其中样本制备芯片是承载空间转录组信息捕获的核心技术,capture Area 为6.5 x 6.5 mm捕获点阵组成,每个点阵上包含有55μm直径,间距100μm的携带空间Barcodes和UMI,Poly(dT)的探针群组成。结构如下图所示:
01
样本制备
在样本制备之前,建议先进行组织优化,如下所示对待研究的组织进行透化时间摸索,一般根据研究的样本设置30分钟以内的时间梯度段,该示例为小鼠脑组织,透化时间根据显影选择18min。
选择好透化的时间,就可以进行样本的制备了。注意组织切片不能覆盖芯片红色边框区域。
02
文库构建
10X Genomics Visium 空间转录组文库结构如图所示:
03
上机测序
10X Genomics Visium 系统对接大部分illumina测序平台,下机测序数据为fastq格式。由上述文库结构也可以得知,最后将获得包含空间barcode和UMI信息的28bp的Read1和捕获到的120bp的RNA目标序列Read2。
04
数据分析
10X Genomics visium 提供了两款软件用以空间转录组数据的分析。一个是基于命令行进行图片和测序数据处理的软件SpaceRanger;一个是基于交互操作的可视化分析软件Loupe Browser。这两款软件都可以在其官网上获得,并且操作也比较简单。除此之外,也可以用seurat 单细胞分析的R软件包进行。
1
Spaceranger分析
整体分析流程如图所示:
Space Ranger Pipeline 分步如下:
Step1:下载软件和参考数据库,自行在10X官网上下载;
Step2:解压软件和参考数据库文件;
tar -xzvf spaceranger-1.0.0.tar.gz
tar -xzvf refdata-cellranger-mm10-3.0.0.tar.gz
Step3:准备数据,执行命令行操作;
这里下载官网demo数据进行。
Space Ranger 包含以下功能,依次为fastq 文件转化,数据分析,文件格式转化,建库gtf文件转化,参考数据库构建,流程测试,上传日志和计算节点检查。mkfastq、mkref 和count 是常用的命令功能。
spaceranger mkfastq
spaceranger count
spaceranger mat2csv
spaceranger mkgtf
spaceranger mkref
spaceranger testrun
spaceranger upload
spaceranger sitecheck
spaceranger-1.0.0/bin/spaceranger count --id=分析的样本名称 --fastqs=待分析的fastq路径 --transcriptome=refdata-cellranger-mm10-3.0.0 --image=组织H&E图片(.jpg or .tiff格式 ) --unknown-slide(--slide=SLIDE 芯片的编号 --area=AREA组织所在的芯片区域) --sample=fastq文件前缀 --localcores=20 --localmem=128
(上面最后一行代码较长,可以滑动查看哦~)
Tips
虽然空间芯片一共仅5000个Spots,但是程序需要位置信息的匹配等一系列操作,所以需要相当大的内存和线程。一般仅400M reads 数据,按照20个线程,128G内存,运行时间在4-6小时之间。
Step4:数据结果解读。
其中,
analysis/文件夹包含了二次分析的结果文件,Spots 聚类信息;
*.cloupe文件可以导入Loupe Browser进行可视化分析的;
filtered_feature_bc_matrix 为空间Spots基因表达矩阵文件;
Spatial/文件夹包含图像文件和图像位置信息文件;
web summary.html 是空间转录组分析样本的基本信息文件,可以作为项目的质控文件(后期文章我们将会对空间转录组质控进行专一详细的介绍,敬请期待哦)。
2
Loupe Browser
Loupe Browser 可视化软件,操作个性化较强,也比较简单,这里就不做赘述了(后期文章我们将会对该软件进行专一详细的介绍,敬请期待哦)。这里需要了解的是它可以做组织H&E图片的矫正处理即可。
2
Seurat 分析
Seurat 是一款特别出色的单细胞分析R包,曾经推出了很多优秀的单细胞分析解决方案,在2019年年底推出了空间转录组分析的Seurat3.2版本。今天就和大家一起目睹下它的风采吧~
Step1:Seurat3.2安装;
在安装新版的seurat 之前,需要先安装R3.6版本
devtools::install_github("satijalab/seurat", ref = "spatial")
##也可以先行下载到本地进行安装install.packages("satijalab-seurat-v3.1.1-302-g1cb8a3d.tar.gz", repos = NULL, type = "source")
Step2:读取数据
##先导入需要的R包
library(Seurat)
library(ggplot2)
library(cowplot)
library(dplyr)
##官网直接导入的SeuratData,library(SeuratData)当然我们可以用前面Space Ranger运行的结果数据进行分析
brain<-Seurat::Load10X_Spatial("/path/out/") #读取数据的路径下应包含两个文件,表达矩阵文件和组织图片文件夹,即filtered_feature_bc_matrix.h5 和spatial/
Step3:数据展示
数据预处理,空间Spots表达水平
(代码较长,可以滑动查看哦~)
plot1 <- VlnPlot(brain, features = "nCount_Spatial", pt.size = 0.1) + NoLegend()
plot2 <- SpatialFeaturePlot(brain, features = "nCount_Spatial") + theme(legend.position = "right")
plot_grid(plot1, plot2)
降维聚类分析
(代码较长,可以滑动查看哦~)
brain <- SCTransform(brain, assay = "Spatial", return.only.var.genes = FALSE, verbose = FALSE)##用SCT进行归一化
brain <- GroupCorrelation(brain, group.assay = "Spatial", assay = "SCT", slot = "scale.data", do.plot = FALSE)## 计算SCT noraml与表达水平的相关性
##降维,聚类
brain <- RunPCA(brain, assay = "SCT", verbose = FALSE)
brain <- FindNeighbors(brain, reduction = "pca", dims = 1:20)
brain <- FindClusters(brain, verbose = FALSE)
brain <- RunUMAP(brain, reduction = "pca", dims = 1:20
p1 <- DimPlot(brain, reduction = "umap", label = TRUE)
p2 <- SpatialDimPlot(brain, label = TRUE, label.size = 3)
plot_grid(p1, p2)
寻找marker基因
(代码较长,可以滑动查看哦~)
object.markers <- FindAllMarkers(object = brain, only.pos = FALSE, min.pct = 0.20, logfc.threshold = 0.25)
top <- object.markers %>% group_by(cluster) %>% top_n(1, avg_logFC) ##取每个cluster差异最显著的一个marker基因
VlnPlot(object = brain, features = top$gene, ncol = 2, pt.size = 0,idents=top$cluster)##对选取的marker基因进行小提琴图型展示
SpatialFeaturePlot(brain, features = top$gene, ncol = 3, pt.size.factor = 10)#marker基因高亮展示
介绍到这里相信大家对空间转录组10X Genomics visium 分析流程和Seurat 包数据分析都有了一定的了解,那么这项技术主要应用在哪些方面呢?跟自己正研究或者待研究的课题有什么辅助指导意义呢?那就敬请关注我们下一讲吧,空间转录组应用研究思路。我们先预告一下应用领域,如下:
https://support.10xgenomics.com/spatial-gene-expression
https://satijalab.org/seurat/vignettes.html
作者:路子
审稿:童蒙
排版:amethyst